뉴스기사 요약

1. 데이터 수집

2. Abstractive Summarization

  1. Abstractive 모델 구성을 위한 텍스트 전처리 단계가 체계적으로 진행되었다.

    분석단계, 정제단계, 정규화와 불용어 제거, 데이터셋 분리, 인코딩 과정이 빠짐없이 체계적으로 진행되었다.

  2. 텍스트 요약모델이 성공적으로 학습되었음을 확인하였다.

    모델 학습이 진행되면서 train loss와 validation loss가 감소하는 경향을 그래프를 통해 확인했으며, 실제 요약문에 있는 핵심 단어들이 요약 문장 안에 포함되었다.

  3. Extractive 요약을 시도해 보고 Abstractive 요약 결과과 함께 비교해 보았다.

    두 요약 결과를 문법완성도 측면과 핵심단어 포함 측면으로 나누어 비교하고 분석 결과를 표로 정리하여 제시하였다.

1. 데이터 수집

2. Abstractive Summarization

2-1. 데이터 전처리

2-2. 어텐션 메커니즘 사용

2-3. 실제 결과와 요약문 비교

원래의 요약문(headlines 열)과 학습을 통해 얻은 추상적 요약의 결과를 비교해 보세요.

3. Extractive Summarization

4. 결과 비교

[Abstractive Summarization]
문법적 요소를 지키기 위해 연결하는 부분이 생각보다 매끄럽다.
적절하지 못한 생성도 보였으나, 데이터가 많아질 수록 해결될 것으로 예상된다.

[Extractive Summarization]
간편하지만 '추출'의 한계가 보인다. 또한 적절한 ratio를 알기가 어렵다.